کتاب The Azure Data Lakehouse Toolkit: Building and Scaling Data Lakehouses on Azure with Delta Lake, Apache Spark, Databricks, Synapse Analytics, and Snowflake

وضعیت موجودی موجود

مقایسه شود

قیمت قبلی: 6,470,000 ریال

قیمت: 6,070,000 ریال

جلد سخت سیاه و سفید

Product details

Publisher ‏ : ‎ Apress; 1st ed. edition (July 14, 2022)
Language ‏ : ‎ English
Paperback ‏ : ‎ 487 pages
ISBN-10 ‏ : ‎ 1484282329
ISBN-13 ‏ : ‎ 978-1484282328

Design and implement a modern data lakehouse on the Azure Data Platform using Delta Lake, Apache Spark, Azure Databricks, Azure Synapse Analytics, and Snowflake. This book teaches you the intricate details of the Data Lakehouse Paradigm and how to efficiently design a cloud-based data lakehouse using highly performant and cutting-edge Apache Spark capabilities using Azure Databricks, Azure Synapse Analytics, and Snowflake. You will learn to write efficient PySpark code for batch and streaming ELT jobs on Azure. And you will follow along with practical, scenario-based examples showing how to apply the capabilities of Delta Lake and Apache Spark to optimize performance, and secure, share, and manage a high volume, high velocity, and high variety of data in your lakehouse with ease.
The patterns of success that you acquire from reading this book will help you hone your skills to build high-performing and scalable ACID-compliant lakehouses using flexible and cost-efficient decoupled storage and compute capabilities. Extensive coverage of Delta Lake ensures that you are aware of and can benefit from all that this new, open source storage layer can offer. In addition to the deep examples on Databricks in the book, there is coverage of alternative platforms such as Synapse Analytics and Snowflake so that you can make the right platform choice for your needs.
After reading this book, you will be able to implement Delta Lake capabilities, including Schema Evolution, Change Feed, Live Tables, Sharing, and Clones to enable better business intelligence and advanced analytics on your data within the Azure Data Platform.

What You Will Learn

Implement the Data Lakehouse Paradigm on Microsoft's Azure cloud platform
Benefit from the new Delta Lake open-source storage layer for data lakehouses
Take advantage of schema evolution, change feeds, live tables, and more
Write functional PySpark code for data lakehouse ELT jobs
Optimize Apache Spark performance through partitioning, indexing, and other tuning options
Choose between alternatives such as Databricks, Synapse Analytics, and Snowflake

Who This Book Is For

Data, analytics, and AI professionals at all levels, including data architect and data engineer practitioners. Also for data professionals seeking patterns of success by which to remain relevant as they learn to build scalable data lakehouses for their organizations and customers who are migrating into the modern Azure Data Platform.

Source Code Repository

The complete source code for this book can be found within the following GitHub respository:

github.com/Apress/the-azure-data-lakehouse-toolkit

منابع کتاب کتاب The Azure Data Lakehouse Toolkit: Building and Scaling Data Lakehouses on Azure with Delta Lake, Apache Spark, Databricks, Synapse Analytics, and Snowflake

با استفاده از Delta Lake، Apache Spark، Azure Databricks، Azure Synapse Analytics و Snowflake یک Lakehouse مدرن داده بر روی پلتفرم داده Azure طراحی و اجرا کنید. این کتاب جزئیات پیچیده پارادایم Data Lakehouse و نحوه طراحی کارآمد یک خانه داده مبتنی بر ابر را با استفاده از قابلیت‌های Apache Spark بسیار کارآمد و پیشرفته با استفاده از Azure Databricks، Azure Synapse Analytics و Snowflake به شما می‌آموزد. شما یاد خواهید گرفت که کد PySpark کارآمد را برای کارهای دسته ای و جریانی ELT در Azure بنویسید. و شما مثال‌های عملی و مبتنی بر سناریو را دنبال خواهید کرد که نشان می‌دهد چگونه از قابلیت‌های Delta Lake و Apache Spark برای بهینه‌سازی عملکرد، و ایمن‌سازی، اشتراک‌گذاری و مدیریت حجم بالا، سرعت بالا و تنوع بالای داده‌ها در Lakehouse خود استفاده کنید. با سهولت.
الگوهای موفقیتی که از خواندن این کتاب به دست می‌آورید به شما کمک می‌کند مهارت‌های خود را برای ساخت خانه‌های دریاچه‌ای با عملکرد بالا و مقیاس‌پذیر سازگار با ACID با استفاده از قابلیت‌های ذخیره‌سازی و محاسباتی جداشده انعطاف‌پذیر و مقرون‌به‌صرفه تقویت کنید. پوشش گسترده دریاچه دلتا تضمین می کند که شما از همه چیزهایی که این لایه ذخیره سازی منبع باز جدید می تواند ارائه دهد آگاه باشید و می توانید از آنها بهره مند شوید. علاوه بر مثال‌های عمیق در مورد Databricks در کتاب، پلتفرم‌های جایگزینی مانند Synapse Analytics و Snowflake را پوشش می‌دهد تا بتوانید پلتفرم مناسبی را برای نیازهای خود انتخاب کنید.
پس از مطالعه این کتاب، می‌توانید قابلیت‌های Delta Lake، از جمله Schema Evolution، Change Feed، Live Tables، Sharing و Clones را پیاده‌سازی کنید تا هوش تجاری بهتر و تجزیه و تحلیل‌های پیشرفته را روی داده‌های خود در پلتفرم داده‌های Azure فعال کنید.

آنچه شما یاد خواهید گرفت

پارادایم Data Lakehouse را در پلتفرم ابری Azure مایکروسافت پیاده سازی کنید
از لایه جدید ذخیره سازی منبع باز Delta Lake برای خانه های دریاچه داده بهره مند شوید
از تکامل طرحواره، تغییر فیدها، جداول زنده و موارد دیگر بهره ببرید
کد کاربردی PySpark را برای مشاغل ELT lakehouse داده بنویسید
عملکرد Apache Spark را از طریق پارتیشن بندی، نمایه سازی و سایر گزینه های تنظیم بهینه کنید
بین گزینه هایی مانند Databricks، Synapse Analytics و Snowflake یکی را انتخاب کنید

این کتاب برای

متخصصان داده، تجزیه و تحلیل و هوش مصنوعی در همه سطوح، از جمله معماران داده و متخصصان مهندس داده، چه کسی است. همچنین برای متخصصان داده که به دنبال الگوهای موفقیت هستند تا با یادگیری ساخت خانه های داده مقیاس پذیر برای سازمان ها و مشتریانی که به پلتفرم داده Azure مدرن مهاجرت می کنند، مرتبط باقی بمانند.

مخزن کد

منبع کد منبع کامل این کتاب را می توانید در مخزن GitHub زیر پیدا کنید:

github.com/Apress/the-azure-data-lakehouse-toolkit

نظرات کاربران درباره کتاب The Azure Data Lakehouse Toolkit: Building and Scaling Data Lakehouses on Azure with Delta Lake, Apache Spark, Databricks, Synapse Analytics, and Snowflake

نظری در مورد این محصول توسط کاربران ارسال نگردیده است.

اولین نفری باشید که در مورد کتاب The Azure Data Lakehouse Toolkit: Building and Scaling Data Lakehouses on Azure with Delta Lake, Apache Spark, Databricks, Synapse Analytics, and Snowflake نظر می دهد.